서울시 치안데이터 분석

“CCTV가 많으면 범죄율을
낮추는 데에 도움이 될까요?”

출처: 서울시 공공데이터포털 (https://data.seoul.go.kr/)

<<<<<<< HEAD

데이터 살펴보기

TOP 3
    자치구       총생활인구수
16  송파구  753278.4966
0   강남구  633521.1274
3   강서구  533814.0426
<<<<<<< HEAD
======= <<<<<<< HEAD
TOP 3
    자치구   1인가구수
4   관악구  150745
3   강서구  104509
16  송파구   87140

데이터 살펴보기
<<<<<<< HEAD
======= <<<<<<< HEAD
자치구
강남구    7007
관악구    5366
서초구    5060
Name: count, dtype: int64
<<<<<<< HEAD
======= <<<<<<< HEAD
자치구
강남구    1713
용산구    1421
구로구    1372
Name: count, dtype: int64

안전벨과 CCTV의 상관관계: 0.3032
예상과 달리, CCTV와 안전벨의 상관관계가 높지 않다.

데이터 살펴보기
<<<<<<< HEAD
======= <<<<<<< HEAD
<<<<<<< HEAD
======= <<<<<<< HEAD

치안센터와 경찰관 수의 상관관계: 0.6500
다른 변수들과 비교했을 때 가장 높은 상관관계를 보임

데이터 살펴보기
<<<<<<< HEAD
======= <<<<<<< HEAD
    자치구  술집 수
17  양천구  3094
7   금천구  3179
10  동작구  3276
<<<<<<< HEAD
======= <<<<<<< HEAD
     자치구  술집 수
12  서대문구  3578
7    금천구  3179
14   성동구  4001

술집 수와 총 범죄 건수의 상관계수: 0.8354
다른 변수들과 비교했을 때, 가장 높은 상관관계를 보임

상관계수 분석

<<<<<<< HEAD
======= <<<<<<< HEAD
=======
>>>>>>> af031b1c29b40b11ba359786b5c8fd421cdc396d >>>>>>> e5110ca6a69385c020481de649a4dcb8bc85b398

범죄건수 주요 변수

  • 술집 수
  • 생활 인구 수
  • 구별 경찰 수
  • CCTV 총 수량
  • 1인가구수

회귀분석

상관 관계 높은 변수 임의 선택

VS Stepwise로 변수 선택

<<<<<<< HEAD

저희는 K-Means 클러스터링을 사용해서 했음요

=======

서울시 치안 기준 군집화

상관계수가 높은 변수를 활용해서,

비슷한 치안 특성을 가진 구를 찾기위해

저희는 K-Means 클러스터링을 사용했습니다.

>>>>>>> af031b1c29b40b11ba359786b5c8fd421cdc396d

K-Means 클러스터링이란?

유사한 특성을 가진 데이터를 자동으로 그룹으로 묶는 비지도 학습 기법

서울시 자치구별 ‘구별_경찰수’, ‘유흥업소_개수’, ‘총생활인구수’, ‘cctv’ 등을 기준으로 치안 특성이 비슷한 지역을 자동으로 군집화하기 위해 사용했습니다.

<<<<<<< HEAD

“CCTV가 많으면 범죄율을
낮추는 데에 도움이 될까요?”

======= >>>>>>> af031b1c29b40b11ba359786b5c8fd421cdc396d

하지만 분석 결과는…?